性能突破2EFlops！国产超算时隔九年再度登顶全球,中国超算系列

文/观察者网吕栋

6月23日下午，在德国汉堡国际超算大会（ISC2026）上，新一期全球超算TOP500榜单公布。其中全国产自主研制的“灵晟”超级计算机，以2.19EFlops（每秒10的18次方浮点运算）持续双精度浮点性能登顶。

这不仅是世界首台持续性能超二百亿亿次（2EFlops）的超算系统，也是继2017年“神威·太湖之光”之后，中国超算时隔九年再次重返世界第一。同时，“灵晟”也是全球第五台百亿亿次级超级计算机。

在本次排名中，美国劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二，美国橡树岭国家实验室的Frontier以1.353 Exaflop/s位列第三。

国家超级计算深圳中心发文直言，“灵晟”全面领先美欧E级超算，强势宣告中国超算重回世界之巅。

“灵晟”最值得关注的，在于走了一条与当前主流超算不同的路。颁奖仪式上，“灵晟”超算系统总设计师、国家超算深圳中心主任、中山大学教授卢宇彤指出，超算发展已迈入超智融合新阶段，“灵晟”系统首创Online Acceleration的全CPU架构，打破传统CPU-GPU异构架构壁垒，内嵌AI矩阵加速单元，回归计算加速的本质，实现超算智算等多种计算模式的高效协同，全面赋能科学智能计算。

从架构来看，“灵晟”共包含20480个计算节点，每个节点搭载两颗基于ARMv9架构的LX2处理器，运行频率1.55GHz。每颗处理器包含两个计算芯粒，每个芯粒划分为四个NUMA域，每个NUMA域包含38个ARMv9核心和4GB高带宽内存。全系统共计近1400万个CPU核心。节点之间采用国产“灵启”互连技术，以双平面多轨胖树拓扑连接，每节点带宽1.6Tb/s；系统运行麒麟操作系统。

卢宇彤分享到，“灵晟”定位为面向科学工程智能计算的国产全栈融合基础设施：

在芯片层，自研LX2CPU创新性引入多精度与矩阵加速等能力，实现片上超算算力与智能算力深度融合，并集成了首颗国产HBM，内存带宽相比传统CPU提升10倍；在网络层，自主设计的灵启高速互连网络可支持200万个端口、10万节点的超大规模组网；在存储层，采用分层架构，兼顾高性能作业区与容量型数据区，可扩展至E级；在系统层，构建大规模超智融合框架，自研全栈软件，将底层硬件能力以可用、可编程、可优化的方式释放给应用，提高各领域应用性能；在节能方面，首创100%全液冷散热计算机柜，以51GFlops/W能效比，在世界第一的持续性能之上，树立绿色计算新标杆。

全球超算算力排名

超算是拥有极高计算速度和强大并行处理能力的计算系统，专门用于处理科学研究、气候模拟、药物研发、天体物理等需要大量计算的数据密集型任务，可预测天气、模拟台风路径、研发新药、筛选抗癌分子。

上一次中国超算登顶TOP500，是2017年的“神威·太湖之光”。这台安装于国家超级计算无锡中心的集群，以93 Petaflop/s的Linpack成绩位居榜首，并保持了两年半之久，直到2018年春季橡树岭国家实验室的IBM Summit系统问世。“神威·太湖之光”采用中国自主设计的“申威”系列芯片，是全球第一台运行速度超过10亿亿次/秒的超级计算机，峰值性能高达12.5亿亿次/秒，持续性能达到9.3亿亿次/秒。2019年，美国政府对华实施制裁并限制中国获取最强大的芯片，此后中国停止了向TOP500提交Linpack测试结果。尽管中国仍在继续建设超算，但在此后近九年的时间里，TOP500榜首一直由美国和欧洲的系统占据。

如今“灵晟”的登顶，打破了这一局面。

“灵晟”超算系统总设计师、国家超算深圳中心主任、中山大学教授卢宇彤

本次TOP500榜单中，“灵晟”登顶后，其他超算排名均顺延一位。劳伦斯·利弗莫尔国家实验室的El Capitan以1.809 Exaflop/s位列第二，橡树岭国家实验室的Frontier以1.353 Exaflop/s位列第三，阿贡国家实验室的Aurora以1.012 Exaflop/s位列第四，德国于利希超级计算中心的JUPITER Booster以1.000 Exaflop/s位列第五。前十名中有一张新面孔——意大利能源公司埃尼集团的HPC7以571.5 Petaflop/s首次亮相便跻身第六。微软Azure云平台的Eagle系统降至第七，意大利埃尼的HPC6位列第八，日本的Fugaku以442 Petaflop/s位列第九，瑞士的Alps以434.9 Petaflop/s位列第十。

TOP500在新闻稿中指出，超级计算领域的高端架构正呈现出显著的多样性。从全中国自主研发的全CPU架构的“灵晟”，到配备AMD加速器的HPE Cray集群（如El Capitan和Frontier），再到采用英伟达 Grace Hopper架构的JUPITER Booster和Alps，乃至搭载英特尔Ponte Vecchio GPU的Aurora系统，没有哪一种架构占据绝对主导地位。微软的Eagle集群结合了Intel Xeon处理器和Nvidia H100加速器，而日本的Fugaku则基于富士通的A64FX Arm处理器构建。“这份榜单表明，通往领先级计算领域并没有单一的主导技术路径。相反，厂商们正在探索各种CPU、GPU、APU和定制加速器方案，并结合不同的互连和系统设计。”

“灵晟”的登顶，不仅是性能的突破，更是一种技术路线的验证。在AMD与英伟达GPU对华出口禁令持续生效的背景下，中国超算选择了一条不依赖外部GPU的全CPU路径，并在全球最权威的性能榜单上证明了这条路径的可行性。这背后是芯片、互连、存储、系统软件、散热等各个环节的全面自主突破。“灵晟”的价值最终体现在应用上——在大规模并行环境下平均扩展效率84.4%，实现了超过千万核心的全系统高效可扩展运行。从2017年“神威·太湖之光”的93 Petaflop/s到2026年“灵晟”的2.198 Exaflop/s，中国超算在近九年的时间里完成了超过23倍的性能跃升，重新定义了全球超算的算力天花板。

本文系观察者网独家稿件，未经授权，不得转载。